百模大战V5：收录74个国产大模型，国产开源有进展但仍然非常弱

Original 走向未来走向未来 2023-08-31

收录于合集

国产大模型仍然“涨势”喜人，已经达到74个（见表一），以这个速度，百模的目标指日可待！接下来需要思考的是如何评价各个大模型，以评出大模型的“百大排行榜”。另一方面，在持续增加的大模型中，北京的占有率依然保持在50%以上【见图一】，这波浪潮对北京来说，真宛若互联网浪潮那一波了！

本周新增的大模型中，有两个开源的基础大模型值得一说。

一个是百川智能开放了 baichuan-7B，在多个评测中号称中文第一。
另一个是智源开放了悟道天鹰的下载，也是7B参数规模的大模型。

国产大模型在开源开放的道路上走的越来越好了，但遗憾的是，目前国产大模型还继续走在吹牛的路上，好用的几个都是7B 这个规模的，这距离真正意义上的大模型（能够打好 AGI 基础的）还非常远。下一步是期待100B 以上的开源开放国产大模型。

说到这个，继续建议国家队入场，完成以下三个事情：

1. 国家主导训练一个1T（1万亿，GPT4的规模）参数规模或更大规模的国产开源开放基础模型，允许商用，最好是无限制的商用。

2. 大模型的智能水平（如认知科学或心智模型等）的评估，包括数据集和评估工具等。这个出发点是 AGI 的智力评估，类似对人的智力和专业能力的评估一样。

3. 开放符合社会主义价值观和中国公序良俗的训练数据集，包括大规模无监督的语料以及 SFT或 RLHF 的训练数据集等。

国家队搞基础模型、数据等既有助于追赶国际最高水平，同时也能够避免资源浪费，符合碳达峰碳中和的目标的。

说到 AGI，除了基础大模型之外，还需要做到以人为本，要尊重事实和知识，做到“知之为知之，不知为不知”。以人为本 AGI 则需要其他工具，比如知识图谱。这个论述此前说过多次，摘录如下“以人为本AGI=神经网络大模型 NN ⊕ 知识图谱 KG⊕ 强化学习RLHF。这里面的神经网络大模型负责理解语言，类似人的大脑【连接主义，图灵奖获得者Yoshua Bengio花书《深度学习》】；知识图谱则负责事实与知识，类似人类使用的百科全书【符号主义，王文广的珠峰书《知识图谱：认知智能理论与实战》】；强化学习负责从环境中学习，类似人类的吃一堑长一智实现进化【行为主义，Richard S. Sutton《强化学习》】。”

接下来是详细数据。首先是大模型列表，原始数据放在Github 上随时更新：https://github.com/wgwang/LLMs-In-China 。欢迎大家给 PR，给 Issue，或者评论里补充遗漏的大模型。V5版本的国产大模型观察见表一。按城市的数据统计见图一。

表一：国产大模型列表，V5版本，收录74个

序号	公司	大模型	省市	官网
1	百度	文心一言	北京	✔
2	科大讯飞	星火	安徽合肥	✔
3	达观数据	曹植	上海	✔
4	阿里云	通义千问	浙江杭州	✔
5	复旦大学	MOSS	上海	✔
6	清华大学	ChatGLM	北京	✔
7	华为	盘古	深圳	✔
8	智源	悟道·天鹰AQUILA	北京	✔
9	哈尔滨工业大学	本草	黑龙江哈尔滨	✔
10	贝壳	BELLE	北京	✔
11	百川智能	baichuan	北京	✔
12	OpenBMB	CPM	北京	✔
13	上海AI实验室	书生·浦语	上海	✔
14	云知声	山海	北京	✔
15	澜舟科技	孟子	北京	✔
16	深思考人工智能	Dongni	北京	✔
17	中科院	紫东太初	北京	✔
18	虎博科技	TigerBot	上海	✔
19	IDEA研究院	封神榜MindBot	广东深圳	✔
20	微盟	WAI	上海	✔
21	360	智脑	北京	✔
22	度小满	轩辕	北京	✔
23	华南理工大学未来技术学院	扁鹊, 灵心SoulChat	广东广州	✔
24	西北工大+华为	秦岭·翱翔	陕西西安	✘
25	奇点智源	Singularity OpenAPI	北京	✔
26	超对称技术公司	乾元	北京	✔
27	稀宇科技	MiniMax	上海	✔
28	西湖心辰	西湖	浙江杭州	✔
29	晓多科技+国家超算成都中心	晓模型XPT	四川成都	✘
30	中科闻歌	雅意	北京	✘
31	北京语言大学	桃李	北京	✔
32	商汤科技	日日新	上海	✔
33	国家超级计算天津中心	天河天元	天津	✘
34	星环科技	无涯、求索	上海	✘
35	慧言科技天津大学	海河·谛听	天津	✘
36	宇视科技	梧桐	浙江杭州	✘
37	电信智科	星河	北京	✘
38	左手医生	左医GPT	北京	✔
39	智慧眼	砭石	湖南长沙	✘
40	好未来	MathGPT	北京	✘
41	数慧时空	长城	北京	✘
42	理想科技	大道Dao	北京	✘
43	硅基智能	炎帝	江苏南京	✘
44	中工互联	智工	北京	✘
45	创业黑马	天启	北京	✘
46	追一科技	博文Bowen	广东深圳	✘
47	网易有道	子曰	北京	✘
48	网易伏羲	玉言	广东广州	✘
49	昆仑万维	天工	北京	✔
50	知乎	知海图	北京	✘
51	医疗算网	Uni-talk	上海	✘
52	孩子王	KidsGPT	江苏南京	✘
53	中科创达	魔方Rubik	北京	✘
54	腾讯	混元	广东深圳	✘
55	拓尔思	拓天TRSGPT	北京	✘
56	乐言科技	乐言	上海	✘
57	清博智能	先问	北京	✘
58	智子引擎	元乘象	江苏南京	✔
59	拓世科技	拓世	江西南昌	✘
60	循环智能	盘古	北京	✔
61	印象笔记	大象GPT	北京	✘
62	第四范式	式说	北京	✔
63	字节跳动	Grace	北京	✘
64	出门问问	序列猴子	北京	✔
65	数说故事	SocialGPT	广东广州	✘
66	云从科技	从容	广东广州	✔
67	电科太极	小可	北京	✘
68	中国农业银行	小数ChatABC	北京	✘
69	麒麟合盛	天燕AiLMe	北京	✔
70	台智云	福尔摩斯FFM	台湾	✔
71	医联科技	medGPT	四川成都	✘
72	理想汽车	MindGPT	北京	✘
73	港中文深圳	华佗GPT	广东深圳	✔
74	长虹	长虹超脑	四川绵阳	✘